# -*- coding: utf-8 -*-
"""
@Time    : 2025/3/11 11:10 
@Author  : ZhangShenao 
@File    : 1.下载Bert模型.py
@Desc    : 下载BERT模型
"""

import dotenv
# 导入transformers依赖库
# AutoModelForCausalLM代表模型
# AutoTokenizer代表分词器
from transformers import AutoModelForCausalLM, AutoTokenizer

# 加载环境变量
dotenv.load_dotenv()

# 指定模型名称和保存路径
model_name = "bert-base-chinese"

# 指定模型文件保存路径
cache_dir = "./models/bert-base-chinese"

# 下载模型和分词器到指定路径
# 分词器通常与具体的模型绑定,每个大模型都有与之匹配的分词器实现
AutoModelForCausalLM.from_pretrained(model_name, cache_dir=cache_dir)
AutoTokenizer.from_pretrained(model_name, cache_dir=cache_dir)

print(f"模型与分词器下载完成。模型名称: {model_name}, 存储路径: {cache_dir}")
